0%

Machine Learning

周志华的同名书籍的阅读笔记,入门读物

第一章 绪论

1.1 引言

1.2 基本术语

classification:预测结果是离散值(好瓜、坏瓜)

regression:预测结果是连续值(成熟度0.95 0.37)

binary classification:只涉及两个结果的分类,通常称之为一个为positive class 一个为 negative class

multi-class classification:多分类

预测任务是希望通过训练对训练集{(x1,y1),(x2,y2)…(xm,ym)}进行学习,建议一个从输入空间X到输出空间Y的映射,对于二分类任务,通常另Y = {-1,1}或者{0,1},对多分类任务,|Y|>2,回归任务,Y = R,R是实数集。

学习完毕模型后,使用其预测的过程叫做测试(testing),被预测的样本称为“测试样本”(testing sample),例如在学得f之后,对测视例x,可得到其预测目标y = f(x).

聚类(clustering),即将训练集中的西瓜分为若干组(cluster),在聚类学习中,分的类我们是事先不知道的,学习过程中使用的训练样本通常不配拥有标记信息。

根据训练数据是否用哦与标记信息,学习任务大致可以划分为两大类:“监督学习(supervised learning)和非监督学习(unsupervised learning),分类和回归是前者的代表,聚类是后者的代表”